Détection de tableaux dans des documents complexes
نویسندگان
چکیده
RÉSUMÉ. Dans cet article, nous présentons les résultats obtenus par un détecteur de tableau dans le cadre des campagnes MAURDOR, pour lesquelles le corpus présente la particularité de contenir des document fortement hétérogènes dans leur mise en page, leurs scripts et les langues utilisées. ABSTRACT. This paper presents the results obtained by a table detector during the MAURDOR campaign, the corpus of which contain heterogeneous documents in French, English and Arabic with various types of table structures. MOTS-CLÉS : Détection de lignes, Détection de tableaux, Maurdor
منابع مشابه
Détection et segmentation des blocs de texte manuscrits et imprimés dans des documents complexes
RÉSUMÉ. Dans cet article, nous présentons un système de segmentation des zones de texte imprimées ou manuscrites dans des documents complexes. La méthode réalise une première classification des composantes connexes en tant que texte/non-texte, puis un deuxième étage discrimine les composantes manuscrites des composantes imprimées. Les composantes de texte sont ensuite regroupées en blocs homogè...
متن کاملUtilisation de la couleur pour l'extraction de tableaux dans des images de documents
Tables are complex elements that can disturb the automatic analysis of the structure of an image of a document. In this article, we present a method based on the alternation of the color of lines to extract color tables that are not materialized by physical rulings. Experimental results, obtained on a dataset of document images with various layouts, enable to validate the interest of this appro...
متن کاملRetour dexpérience sur la détection automatique de métaphores dans des textes de Géographie
HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau...
متن کاملReprésentation et détection des émotions dans des dialogues enregistrés dans un centre d'appel. Des émotions complexes dans des données réelles
RÉSUMÉ. Les émotions complexes dans des contextes réels ont encore été peu étudiées. Dans ce papier, nous explorons comment représenter et automatiquement détecter le comportement émotionnel de sujets dans le contexte d’interactions orales Homme-Homme. Par rapport aux nombreuses études précédentes conduites sur des données artificielles, ce papier montre les défis auxquels on doit faire face lo...
متن کاملUne architecture semi-supervisée et adaptative pour le filtrage d'alarmes dans les systèmes de détection d'intrusions sur les réseaux
HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2014